COAIM 1/4

Avril 2000





Première Consultation sur la gestion de l'information agricole

DOCUMENT DE TRAVAIL

Rome, 5-7 juin 2000

Normes et directives pour la gestion de l'information agricole

Table des matières


I. INTRODUCTION

1. L'adoption de normes est essentielle pour assurer l'accès dans les meilleurs délais à une information utile et de qualité.

2. Dans le cadre de son rôle normatif, l'une des principales tâches de la FAO est de faciliter l'élaboration et l'adoption de normes et de directives permettant d'améliorer l'efficacité des programmes de développement agricole et de sécurité alimentaire dans le monde entier. Un exemple des efforts entrepris par la FAO pour faciliter l'adoption de normes entre partenaires de la communauté internationale est le Système mondial d'information et d'alerte rapide sur l'alimentation et l'agriculture (SMIAR) (http://www.fao.org/giews).

3. La réussite du programme de systèmes d'alerte rapide de la FAO peut être attribuée dans une large mesure à l'élaboration de normes et de procédures concernant la collecte et l'analyse de renseignements pertinents et leur diffusion à ces systèmes d'alerte dans le monde. La mise en place du SMIAR a fortement contribué à la réduction du risque de famine dans le monde en fournissant un cadre de référence international qui permet d'identifier les endroits où les populations sont exposées à des risques de pénurie alimentaire suffisamment longtemps à l'avance pour que des mesures puissent être prises. Les normes élaborées au titre de ce programme ont donc fortement contribué à sauver des vies dans de nombreux pays au cours des 25 dernières années.

4. L'Internet offre des possibilités remarquables de répondre aux besoins d'information aux fins du développement agricole et de la sécurité alimentaire dans le monde. On constate toutefois maintenant que l'utilisation des technologies et des outils actuels d'Internet pour trouver et extraire des renseignements pertinents se heurte à de graves limitations. L'exemple du programme SMIAR montre comment des normes et des directives peuvent faciliter la collecte, la gestion et la diffusion de l'information pertinente rapides et efficaces.

5. Bien entendu, il existe déjà de nombreuses normes dans les multiples domaines du développement agricole et de la sécurité alimentaire et, en ce qui concerne le programme de gestion de l'information de la FAO, il ne serait ni efficace ni pratique de s'appuyer sur une seule d'entre elles pour essayer de satisfaire les besoins de tous les utilisateurs. Dans le présent document, qu'elle présente pour examen à la Consultation, la FAO propose de créer un cadre normatif pour la gestion de l'information agricole fondé sur les normes acceptées internationalement qui existent déjà dans ce secteur et de relier entre eux les thésaurus1 internationaux existants relatifs aux différents domaines techniques importants pour le développement agricole et la sécurité alimentaire.

6. L'adoption de normes, de systèmes de classement d'une terminologie agréée ne suffit toutefois pas à répondre à tous les besoins en information des secteurs du développement agricole et de la sécurité alimentaire, qui sont, par nature, interdisciplinaires. Il faut pour cela des systèmes d'information permettant d'établir des liens cohérents entre des sujets appartenant à des disciplines différentes de l'agriculture, ainsi qu'entre l'agriculture et d'autres secteurs comme la santé, le commerce et l'enseignement. Pour atteindre tous ces objectifs, il faut une collaboration active entre toutes les parties prenantes et les partenaires aux niveaux national et international. Cette importante question est traitée de façon plus détaillée dans le document connexe sur le Renforcement des capacités de gestion de l'information et des connaissances grâce à la coopération internationale.

7. Le présent document mettra d'abord l'accent sur la « révolution de l'information » consécutive à l'apparition d'Internet. Ensuite, il donne un aperçu des questions clés concernant les normes en matière de gestion de l'information agricole et le rôle de la FAO à cet égard, notamment la tenue à jour et la poursuite de l'amélioration du thésaurus agricole multilingue AGROVOC. Des priorités spécifiques concernant l'application des normes à l'appui du développement agricole et de la sécurité alimentaire sont ensuite suggérées, l'accent étant mis sur le rôle normatif de la FAO. Nous proposons enfin, en vue de leur examen par la Consultation, des mesures à prendre pour mettre en _uvre un programme de normes pour la gestion de l'information agricole.

II. L'INTERNET EST-IL UN OUTIL APPROPRIÉ POUR LA DIFFUSION DE L'INFORMATION ET L'ÉCHANGE DE DONNÉES DANS LE MONDE ENTIER?

A. UTILISATION D'INTERNET

8. Comme indiqué dans le document présenté en séance plénière sur l'accès à l'information et à la communication pour le développement durable et la sécurité alimentaire, les statistiques sur le nombre de sites Web et d'utilisateurs internationaux témoignent de la taille et de la couverture impressionnantes d'Internet. Toutefois, de par son volume même, l'information figurant sur Internet a maintenant dépassé nos capacités de gestion.

B. LES PROBLÈMES INHÉRENTS À INTERNET

9. Internet n'est pas réellement conçu pour gérer des quantités importantes d'information, et moins encore une « révolution de l'information ». Comme il ressort des statistiques présentées dans le document mentionné ci-dessus, la quantité d'information et de données disponibles sur Internet atteint des proportions démesurées. et il existe actuellement peu d'outils permettant de les gérer efficacement. Vu la nature même de l'architecture d'Internet, l'information sur des sujets identiques est éparpillée sur de nombreux serveurs différents du monde entier, mais il existe peu d'outils permettant d'intégrer ces renseignements apparentés issus de sources différentes. Il est donc très difficile de trouver ce dont on a besoin sur Internet.

10. Les moteurs de recherche existants couvrent moins de 15 % de toute l'information disponible sur Internet et fournissent des réponses trop nombreuses et souvent non pertinentes. Quand on utilise un des nombreux moteurs de recherche disponibles pour se renseigner, par exemple, sur la gestion des troupeaux de buffles en cherchant l'expression anglaise « Buffalo Management » dans les 1,6 milliard de pages Web du monde entier, les résultats sont très difficiles à exploiter. Non seulement le moteur de recherche propose plus de 93 000 sites Web répondant à ce critère de recherche, mais il se pose aussi un important problème d'ordre sémantique. En fait, le moteur de recherche fournit un grand nombre de résultats concernant une ville des États-Unis du nom de Buffalo, notamment une adresse permettant d'obtenir des renseignements détaillés sur des cours offerts à la faculté de gestion de l'Université de Buffalo. Cela peut intéresser certaines personnes, mais n'a absolument rien à voir avec l'objet de notre recherche.

11. Le fait est que l'information n'est pas bien organisée sur Internet et qu'il existe très peu de moteurs de recherche qui font appel à des êtres humains pour créer des métadonnées2 afin de mieux classifier l'information disponible. En outre, ils utilisent très peu les répertoires terminologiques comme le thésaurus agricole multilingue AGROVOC, qui garantiraient au moins la pertinence des mots clés utilisés par le fournisseur et le récipiendaire de l'information.

12. En fait, les grands moteurs de recherche indexent Internet pour faciliter la récupération de l'information, mais ils le font de façon automatique sans recourir à l'intervention humaine pour préciser la catégorie à laquelle appartient cette information et sans utiliser de normes ou de vocabulaire agréés. Les moteurs de recherche sont ainsi en mesure de répondre rapidement à une recherche effectuée à partir de mots clés, mais les résultats qu'ils fournissent sont souvent trop nombreux et peu pertinents et, de plus, fréquemment périmés.

13. Même lorsque les moteurs de recherche finissent par présenter des résultats apparemment à jour et pertinents, il est souvent impossible d'établir un lien avec la source indiquée. Ce problème se pose généralement parce que le serveur hôte n'est momentanément pas disponible ou, pire encore, parce que l'information a disparu (on obtient alors le message redouté « erreur 404, Fichier introuvable »). Cette caractéristique peu conviviale des moteurs de recherche est due à l'absence de synchronisation entre les métadonnées générées automatiquement et les éventuels changements ultérieurs concernant l'endroit où se trouve la page Web contenant le renseignement recherché. Cela tient à un des principaux défauts d'Internet: une unité d'information est définie par son emplacement physique ( son « URL »), plutôt que par un identificateur unique qui l'accompagnerait chaque fois qu'elle se déplace.

14. Tous ces problèmes sont principalement dus au fait qu'Internet n'était pas initialement conçu pour fournir un accès universel à l'information et que les normes de gestion de l'information sur lesquelles repose le système ne sont pas entièrement satisfaisantes. Même la norme internationale régissant la publication de documents sur Internet, le langage de balisage hypertexte HTML (HyperText Mark-up Language), n'est pas tout à fait appropriée. Les navigateurs comme Internet Explorer et Netscape interprètent les indications données en HTML pour afficher un document sur Internet de façon uniforme et standardisée, quel que soit le type d'équipement informatique ou le système d'exploitation utilisé pour naviguer sur Internet. HTML est cependant une norme rigide, avec des balises prédéfinies et un mélange particulier de balises de présentation et de données, parfois enrichi au moyen d'un code de procédure comme ASP ou JAVA. Un document HTML n'est pas non plus protégé contre une évolution éventuelle de ce langage. Si celui-ci devait se transformer, de nombreuses organisations pourraient avoir beaucoup de mal à préserver leur capital intellectuel. La seule façon d'y parvenir est d'effectuer une séparation logique entre code d'application, balise de présentation et contenu. C'est un tel concept qui est à la base d'une nouvelle norme, le langage de balisage extensible (XML)3, sur lequel nous reviendrons à plusieurs reprises dans la suite du présent document.

C. RÉGLER LES PROBLÈMES INHÉRENTS À INTERNET

15. Nous nous trouvons donc face au grand paradoxe d'Internet : il possède un potentiel extraordinaire et sans précédent pour la diffusion de données dans le monde entier, mais il peut aussi occasionner de graves problèmes en matière de gestion de l'information! Ces problèmes ne peuvent être résolus que si des mesures sont prises pour :

III. QUESTIONS À PRENDRE EN CONSIDÉRATION PAR LES MEMBRES DE LA FAO AU SUJET DE LA GESTION DE L'INFORMATION AGRICOLE SUR INTERNET

16. Une importante caractéristique qui distingue le secteur agricole de beaucoup d'autres est le fait que la recherche scientifique et les études agricoles restent valides très longtemps. Beaucoup de technologies, de techniques, de méthodologies et de résultats de recherche qui étaient pertinents il y a plusieurs dizaines d'années sont encore applicables, ce qui veut dire que les formats utilisés pour stocker la documentation agricole doivent être à l'épreuve du temps.

17. Nous avons déjà mentionné que HTML ne constitue pas une norme particulièrement appropriée pour archiver les documents à cause du manque de séparation logique en ce qui concerne le contenu, le formatage et les procédures utilisées. Les seules normes internationales actuelles qui permettent ce type de séparation sont le langage SGML et son adaptation pour Internet, XML.

18. La FAO utilise les normes SGML et XML pour préserver la mémoire institutionnelle de l'Organisation, mais aussi pour faciliter la diffusion sur Internet du contenu de ses archives documentaires, qu'on peut trouver à l'adresse http://www.fao.org/docrep.

19. Le Secrétariat de la FAO invite la Consultation à envisager l'adoption de SGML/XML comme norme pour la gestion des documents.

20. Toutefois, les normes de gestion du contenu telles que SGML/XML sont, par elles-mêmes, insuffisantes pour faciliter l'accès aux données et leur échange sur Internet. Il est nécessaire de mettre en place des systèmes de classement internationaux, comme les catégories matières AGRIS/CARIS, et de compiler des vocabulaires agréés internationalement, comme le thésaurus agricole multilingue AGROVOC. Les outils comme AGROVOC ou le thésaurus élaboré par CAB International permettent une utilisation cohérente et précise de la terminologie agricole.

21. Les renseignements publiés sur Internet devraient être accompagnés de métadonnées complémentaires facilitant l'extraction ultérieure des données à l'aide de catégories et des mots clés précis. C'est sur ce concept que repose le Localisateur d'information de la FAO (http://www.fao.org/waicent/search/default.asp), dont la base de données contient une référence correspondant à chaque page publiée sur le site Web de la FAO utilisant les catégories matières d'AGRIS et les termes d'AGROVOC. L'utilisateur final peut alors utiliser les mêmes catégories et les mêmes termes pour extraire les données du site Web de la FAO en employant la même terminologie précise que le producteur de l'information. Le Localisateur d'information fournit la plate-forme et les normes nécessaires pour accéder efficacement à l'information. Si le producteur de l'information ou son utilisateur ont des doutes quant aux termes précis à utiliser, ils peuvent facilement consulter le thésaurus AGROVOC à l'adresse http://www.fao.org/agrovoc.

22. Le Secrétariat de la FAO invite la Consultation à envisager d'adopter et de promouvoir l'utilisation de vocabulaires et de systèmes de classement convenus (comme AGROVOC et les catégories matières AGRIS/CARIS) en vue d'une meilleure gestion de l'information agricole.

23. L'extraction et l'échange d'information seront grandement facilités si de nombreux sites Web agricoles utilisent des normes identiques ou apparentées pour le classement et l'indexation. Plus les sites utilisant la même méthode générale de gestion de l'information seront nombreux, plus il sera facile d'établir des liens entre des informations provenant de sources différentes. Pour que ce soit encore plus facile, il pourrait être utile de conclure des accords internationaux en vue de définir les éléments d'information clés pour différents domaines de l'agriculture (par exemple, pour faciliter l'échange d'information sur les ressources phytogénétiques ou les produits forestiers). Ces normes pourraient alors être appliquées à des types d'information de caractère plus général, par exemple pour échanger des données sur les projets agricoles, les experts et les institutions. Parmi les normes qu'on pourrait envisager d'utiliser, citons la définition du type de document (DTD) XML et le schéma XML.

24. Le Secrétariat de la FAO invite la Consultation à reconnaître la nécessité de mettre en place des éléments de données communs pour permettre une utilisation et un échange efficaces de l'information agricole.

25. En adoptant des systèmes de classement internationaux, des vocabulaires agréés, des normes ouvertes4 et des éléments de données communs comme ceux qui sont indiqués ci-dessus, il serait possible de surmonter les problèmes que pose Internet en matière de gestion de l'information. Il reste toutefois à définir ces types de normes ainsi que les procédures et les lignes directrices les régissant, pour assurer l'accès à l'information agricole sur Internet. La Consultation sur la gestion de l'information agricole offre aux États membres une occasion unique de se pencher prioritairement sur cette question.

IV. LE RÔLE DE LA FAO DANS LA PROMOTION DE NORMES POUR LA GESTION DE L'INFORMATION AGRICOLE

26. Le Codex Alimentarius est un très bon exemple de l'efficacité avec laquelle la FAO contribue à la coopération intergouvernementale en élaborant des normes internationales pour l'alimentation. Le Codex adopte des normes, des lignes directrices et des codes d'usages internationaux recommandés après un examen approfondi de la part de tous les pays membres. Le système du Codex a été instauré pour protéger la santé des consommateurs, assurer l'observation de pratiques loyales dans le commerce international des denrées alimentaires et coordonner l'établissement de normes internationales dans le domaine de l'alimentation. Ces normes alimentaires uniformes dans le monde entier présentent l'avantage de protéger les consommateurs contre les aliments dangereux et permet aux producteurs, aux transformateurs et aux négociants de produits alimentaires d'avoir accès au marché en éliminant les obstacles non tarifaires au commerce. Dans le cadre des accords commerciaux du Cycle d'Uruguay, les normes du Codex servent de référence pour l'évaluation des mesures et des réglementations nationales en matière d'alimentation.

27. Le Centre mondial d'information agricole permet aux États membres de la FAO d'avoir accès aux informations, aux statistiques et aux connaissances spécialisées de la FAO, mais il favorise également la coopération intergouvernementale en fournissant un mécanisme normatif permettant de résoudre de façon générale les problèmes de gestion de l'information et de faciliter la mise en place de systèmes nationaux d'information agricole.

28. En particulier, la FAO, en collaboration avec ses partenaires internationaux, peut fournir aux États membres:

29. En outre, avec l'aide de ses partenaires, la FAO peut coordonner et faciliter au niveau international des activités visant à:

30. La FAO exerce déjà son rôle normatif en matière de gestion de l'information pour aider ses États membres, notamment en :

IV. FUTURES ACTIVITÉS À ENTREPRENDRE PAR LA FAO ET SES MEMBRES

31. L'Internet offre des possibilités sans précédent pour la diffusion de l'information, mais pose aussi d'importants problèmes qu'aucun accord international ne permet de régler. Il faut mettre en place d'urgence les normes, les procédures et les lignes directrices nécessaires pour améliorer la gestion de l'information et l'échange de données sur Internet.

32. Les normes fournissent, de façon générale, une base commune pour l'édification de systèmes d'information. Elles facilitent la compréhension et la communication entre des personnes d'horizons différents, spécialisées dans différents domaines. Elles facilitent l'échange de données et d'information à l'intérieur des organisations et entre celles-ci, ainsi qu'entre des systèmes utilisant des logiciels ou du matériel informatique différents. L'établissement de normes nécessite une coopération entre les producteurs et les consommateurs de données, ce qui n'est pas facile à réaliser, en particulier au niveau international. Dans le cadre de la négociation d'accords sur des normes internationales pour la gestion de l'information agricole, il pourrait être bon que les États membres demandent à la FAO de servir de tribune neutre pour la discussion des questions fondamentales et d'accélérer les choses en se prévalant des services normatifs de la FAO par l'entremise de WAICENT.

33. En particulier, la FAO, en étroite collaboration avec d'autres parties prenantes du secteur de l'agriculture, peut aider les États membres à adopter des normes internationales pour la gestion du contenu telles que SGML et XML et à conclure des accords internationaux sur les systèmes de classement comme les catégories matières AGRIS/CARIS et des vocabulaires agréés, comme le thésaurus multilingue AGROVOC.

34. Les États membres pourront souhaiter également améliorer et compléter AGROVOC pour en faire un outil précis et efficace, y compris pour les chercheurs et les scientifiques. AGROVOC constitue une excellente base pour une meilleure gestion de l'information sur Internet, mais il convient d'évaluer avec soin sa structure et sa fonctionnalité actuelles, étant donné l'évolution rapide de la situation en matière d'information et la tendance à une décentralisation croissante de la production d'information. En particulier, l'institution de liens formels avec d'autres outils terminologiques largement utilisés, comme le thésaurus CAB, pourrait en améliorer grandement la fonctionnalité. En outre, il peut être nécessaire de constituer des vocabulaires plus spécialisés et plus précis pour certains sujets en allant au-delà de ce qu'AGROVOC peut offrir actuellement et de ce qui ne serait même pas approprié dans un thésaurus universel. Des liens entre AGROVOC et de tels vocabulaires spécialisés seraient toutefois utiles et devraient être mis en place. Ainsi complété, AGROVOC (ou ce qu'à la FAO, nous appelons AGROVOX) pourrait ainsi devenir l'outil par excellence pour la gestion de l'information agricole du nouveau millénaire!

35. La Consultation sur la gestion de l'information agricole pourra souhaiter reconnaître que certains des problèmes clés concernant l'accès à l'information agricole et l'échange de données sur Internet peuvent être réglés si des accords internationaux sur les normes de gestion du contenu et les systèmes de classification sont conclus et si des vocabulaires agréés sont établis. À cet égard, la Consultation souhaitera peut-être examiner les propositions et recommandations spécifiques formulées dans le présent document.

36. La Consultation pourra souhaiter inviter la FAO, en collaboration avec d'autres parties prenantes du secteur de l'agriculture, à coordonner et à faciliter la promotion et l'adoption de telles normes auprès de ses États membres.

37. La Consultation pourra souhaiter suggérer que tous les accords internationaux conclus, toutes les procédures adoptées et tous les outils mis au point soient publiés sur le site Web de la FAO, qui pourrait constituer un centre de coordination pour les normes de gestion de l'information dans le secteur agricole.


1 Un thésaurus regroupe de façon systématique un ensemble de termes reliés selon un mode hiérarchique ou associatif, qui ont tous une signification unique et sans ambiguïté. Le cas échéant, des relations d'équivalence avec d'autres termes de la langue courante (synonymes) peuvent aussi être indiquées. Les thésaurus portent généralement sur une discipline déterminée et peuvent contenir entre quelques centaines et 20 000 termes.Un vocabulaire contrôlé n'est en revanche qu'une liste de termes agréés, entre lesquels aucune relation particulière n'est établie.

2 Le terme « médatonnée » désigne des données décrivant une information déterminée pour faciliter sa récupération ou expliquer son contenu. Un catalogue de bibliothèque qui donne divers renseignements relatifs au contenu et à l'emplacement d'un livre est un exemple de métadonnées.

3 XML est un système de codage textuel permettant de créer des documents structurés et aisément compréhensibles par les navigateurs utilisés sur Internet. XML et HTML reposent sur l'utilisation de « balises » accompagnant des unités logiques de texte. Toutefois, alors qu'HTML peut seulement servir à présenter des document sur le Web, XML fournit une structure utilisable pour gérer, extraire et échanger une information textuelle avec une fonctionnalité semblable à celle que fournissent les bases de données relationnelles pour la gestion des données. XML permet à chaque groupe spécifique d'utilisateurs d'élaborer son propre ensemble de balises en fonction de ses propres besoins sans en limiter la présentation à un seul style sur un seul support. Pour plus de détails au sujet de XML, on peut consulter http://www.w3.org/XML.

4 Normes spécialisées qui ne font pas l'objet d'un droit de propriété et qui sont incompatibles avec n'importe quelle plate-forme ou application.